ইমেজ ডেটা প্রিপ্রসেসিং একটি অত্যন্ত গুরুত্বপূর্ণ পদক্ষেপ যা কম্পিউটার ভিশন এবং ইমেজ প্রসেসিং এর কাজগুলোকে সহজ করে তোলে। এটি কাঁচা ইমেজ ডেটাকে মডেলিংয়ের জন্য প্রস্তুত করতে ব্যবহৃত হয়, বিশেষত মেশিন লার্নিং এবং ডিপ লার্নিং অ্যালগরিদমগুলোর জন্য। কার্যকর প্রিপ্রসেসিং মডেলকে ভালোভাবে শিখতে এবং অজানা ডেটাতে ভালোভাবে সাধারণীকরণ করতে সহায়তা করে।
এখানে কিছু সাধারণ ইমেজ ডেটা প্রিপ্রসেসিং টেকনিকস দেওয়া হল:
from PIL import Image
# ইমেজ রিসাইজ করা
image = Image.open('image.jpg')
resized_image = image.resize((224, 224)) # 224x224 এ রিসাইজ
resized_image.show()
import numpy as np
from PIL import Image
# ইমেজকে numpy অ্যারে তে রূপান্তর করা
image = Image.open('image.jpg')
image_array = np.array(image)
# [0, 1] রেঞ্জে নরমালাইজেশন
normalized_image = image_array / 255.0
import cv2
# ইমেজ পড়া
image = cv2.imread('image.jpg')
# গ্রেসকেলে রূপান্তর
grayscale_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow("Grayscale Image", grayscale_image)
cv2.waitKey(0)
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import numpy as np
from tensorflow.keras.preprocessing import image
# অগমেন্টেশন সেটিংস
datagen = ImageDataGenerator(
rotation_range=40,
width_shift_range=0.2,
height_shift_range=0.2,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True,
fill_mode='nearest'
)
# ইমেজ লোড করা
img = image.load_img('image.jpg')
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
# ট্রান্সফরমেশন প্রয়োগ
i = 0
for batch in datagen.flow(x, batch_size=1, save_to_dir='output', save_prefix='aug', save_format='jpeg'):
i += 1
if i > 20:
break
from PIL import Image
# ইমেজ ওপেন করা
image = Image.open('image.jpg')
# রোটেশন
rotated_image = image.rotate(45) # 45 ডিগ্রি ঘুরানো
rotated_image.show()
from PIL import Image
# ইমেজ ওপেন করা
image = Image.open('image.jpg')
# অনুভূমিকভাবে ফ্লিপ
flipped_image = image.transpose(Image.FLIP_LEFT_RIGHT)
flipped_image.show()
import cv2
# ইমেজ পড়া
image = cv2.imread('image.jpg')
# গাউসিয়ান ব্লার প্রয়োগ
blurred_image = cv2.GaussianBlur(image, (5, 5), 0)
cv2.imshow("Blurred Image", blurred_image)
cv2.waitKey(0)
import cv2
# ইমেজ পড়া
image = cv2.imread('image.jpg')
# কনট্রাস্ট এবং ব্রাইটনেস পরিবর্তন
alpha = 1.5 # কনট্রাস্ট কন্ট্রোল
beta = 50 # ব্রাইটনেস কন্ট্রোল
adjusted_image = cv2.convertScaleAbs(image, alpha=alpha, beta=beta)
cv2.imshow("Adjusted Image", adjusted_image)
cv2.waitKey(0)
ইমেজ ডেটা প্রিপ্রসেসিং মডেলকে কার্যকরভাবে শিখতে এবং সাধারণীকরণে সহায়তা করে। বিভিন্ন টেকনিক যেমন রিসাইজিং, নরমালাইজেশন, গ্রেসকেল কনভার্সন, ডেটা অগমেন্টেশন ইত্যাদি ব্যবহার করে ইমেজ ডেটাকে প্রস্তুত করা হয়, যা মডেল ট্রেনিংয়ের সময় পারফরম্যান্স উন্নত করতে সাহায্য করে।
Read more